Arquitectura del crítico: dual vs unificado en loco-manipulación humanoide
La arquitectura del crítico en RL para humanoides es clave: la crítica dual alcanza objetivos 3.5 veces más rápido y duplica la eficiencia frente a la unificada. Descubre por qué.